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摘要 : 随 着 人 类 和 黑猩猩 全 基因 组 测序 工作 宣布 完成 ， 以 及 其 他 灵 长 类 基因 组 测序 工作 的 逐步 开展 ,目前 已 
经 积累 了 大 量 的 灵 长 类 基因 组 数据 ,一 个 密 新 的 研究 领域 一 一 灵 长 类 比较 基因 组 学 应 运 而 生 。 该 文 主要 通过 对 人 
类 和 其 他 非 人 灵 长 类 系统 关系 和 基因 组 结构 的 比较 ,从 系统 进化 、 基 因 组 结构 和 基因 表达 调控 等 方面 评述 该 领域 
的 研究 进展 ,前述 人 类 、 黑 猩猩 与 其 他 非 人 灵 长 类 之 间 的 主要 生物 学 差异 ， 揭 示人 类 进化 的 生物 学 机 制 。 
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Abstract: With the accomplishment of genome sequencing of human, chimpanzee and other primates, there has 
been a great amount of primate genome information accumulated. Primate comparative genomics has become a new 
research field at current genome era. In this article, we reviewed recent progress in phylogeny, genome structure and gene 
expression of human and nonhuman primates, and we elaborated the major biological differences among human, 
chimpanzee and other non-human primate species, which is informative in revealing the mechanism of human evolution. 
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2001 年 ， 人 类 基因 组 计划 草图 序列 的 完成 标志 完成 。 

着 生命 科学 新 纪元 的 开始 , 现在 的 人 类 基因 组 序列 灵 长 类 比较 基因 组 学 主要 是 基于 人 类 和 其 他 
(build 35) 近 平 完整 (International Human Genome 灵 长 类 的 基因 组 测序 工作 已 经 完成 , 通过 比较 基因 
Sequencing Consortium, 2004), 黑猩猩 基因 组 草图 组 学 的 方法 , 探究 灵 长 类 与 其 他 灵 长 类 动物 不 同 的 
已 经 初步 完成 (Chimpanzee Sequencing and Analysis 基因 组 结构 ， 以 及 人 类 与 它们 区 别 的 特征 , 为 研究 
Consortium，2005)。 进 一 步 的 工作 正在 推进 ， 大 猩 人 类 基因 的 特有 结构 和 功能 提供 重要 线索 , 解 开 人 
猩 、 长 辟 猿 等 的 “ 低 履 盖 度 ”版 本 基因 组 图 也 已 完成 。 类 起 源 和 进化 的 许多 奥秘 ,也 是 揭示 智慧 秘密 的 重 
2007 年 ， 科 学 家 破译 了 猕猴 的 基因 组 ,这 是 继 人 类 要 一 步 。 在 基因 组 时 代 ， 从 不 断 增加 的 测序 基因 组 
和 黑猩猩 之 后 ， 科 学 家 破译 出 的 第 3 种 灵 长 类 动物 ， 信息 中 ， 人 们 越 来 越 熟 练 地 解读 其 生物 学 意义 ， 因 
基因 组 。 截 至 2009 年 , 已 有 12 种 灵 长 类 动物 的 基 而 使 人 类 的 “亲戚 ”为 人 类 确定 自己 的 身份 提供 重要 
因 组 处 于 测序 阶段 (图 1)(QMarques-Bonet et al, 线索 。 同 时 , 通过 对 灵 长 类 基因 组 测序 ,了解 人 类 
2009b) 。2011 年 ， 科 学 家 初步 完成 红 毛 猩猩 疾病 的 遗传 学 基础 ， 有 助 于 人 类 疾病 动物 模型 的 建 
(Orangutan) 的 基因 组 测序 , 红 毛 猩猩 成 为 继 人 类 和 Eo 

黑猩猩 之 后 第 3 个 基因 组 成 功 测序 的 狼 类 (Locke et 本 文 将 从 系统 进化 、 基 因 组 结构 和 基因 表达 调 
al, 2011)。 另 外 ,， 婴 猴 和 鼠 狐 猴 的 基因 组 草图 也 基本 ” 控 等 方面 , 对 灵 长 类 比较 基因 学 的 研究 进展 进行 综 
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Fig. 1 Primate genome sequencing status(Marques-Bonet et al, 2009b) 
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图 2 灵 长 类 系统 进化 树 (Enard & Pääbo, 2004; 
Goodman, 1999) 
Fig.2 Phylogenetic tree of primates (Enard & Pääbo, 2004; 
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组 测序 结果 来 研究 亲缘 关系 较 近 的 物种 之 间 的 系 
统 关 系 (Eisen & Fraser, 2003; Gomase & Tagore, 







































































2009). Goodman, 1999) 

目前 灵长目 系统 进化 关系 研究 已 经 比较 清楚 
(图 2),， 仅 眼镜 猴 亚 目的 系统 位 置 有 一 定 的 争议 。 因 由 于 人 类 和 黑猩猩 、 大 猩猩 之 间 亲 缘 关 系 较 近 , 不 
为 研究 发 现在 眼镜 猴 亚 目 、 新 大 陆 猴 和 旧 大 陆 猴 的 。” 能 真实 地 反映 三 者 之 间 的 系统 进化 关系 ， 只 有 利用 














相同 位 点 上 有 3 个 相同 的 Alu 序列 ,所 以 推测 这 3 
类 亚 目 可 能 具有 共同 的 祖先 (Schmitz, et al, 2001)。 
总 体 上 看 ， 猿 类 是 人 类 的 近亲 ， 其 他 灵 长 类 是 一 些 
关系 较 远 的 “ 亲 威 ”, 包括 旧 大 陆 猴 、 新 大 陆 猴 、 
眼镜 猴 和 狐 猴 。 

在 猿 类 ， 非 洲 大 猿 与 人 类 的 关系 比 小 猿 和 红 毛 
猩猩 更 接近 。 但 是 ， 人 类 与 黑猩猩 和 大 猩猩 之 间 的 
关系 哪个 更 近 呢 ? 比较 大 猿 和 人 类 基因 组 数据 时 
发 现 ， 有 18% 的 基因 组 区 域 在 人 类 -黑猩猩 分 支 上 
不 一 致 ， 人 类 和 大 猿 分 支 却 相反 (Chen & Li, 2001). 


3 个 物种 以 外 的 1 个 物种 作为 外 群 (outgroup) 来 进行 
比较 才能 解决 这 个 问题 。 例 如 , 与 3 个 物种 系统 关 
系 最 近 的 是 红 毛 猩猩 它 的 分 支 发 生 在 更 早 以 前 ， 
其 基因 组 中 没有 任何 一 个 区 域 受 到 平衡 选择 等 特 
殊 现象 的 影响 ,所 以 它 作 为 外 群 可 以 真实 反映 人 类 
和 黑猩猩 的 系统 进化 关系 。 现 在 ， 人 类 、 黑 猩猩 和 
红 毛 猩猩 的 基因 组 序列 已 经 部 分 或 全 部 完成 , 所 以 
人 们 可 以 从 基因 组 的 角度 来 解释 人 类 与 黑猩猩 之 
间 的 关系 。 通 过 对 人 类 、 黑 猩猩 和 红 毛 猩猩 3 种 基 
因 组 的 对 比 ， 人 们 惊奇 地 发 现 红 毛 猩猩 的 基因 组 中 
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约 1% 的 序列 与 人 类 基因 组 更 接近 ,而 不 是 黑猩猩 
的 基因 组 。 这 说 明 人 类 和 黑猩猩 的 共同 祖先 经 过 几 
百 万 年 分 别 进化 , 在 这 个 过 程 中 , 黑猩猩 因为 某 些 
原因 失去 了 一 部 分 共同 祖先 的 DNA, 而 人 类 则 保 
留 了 这 些 DNA(Hobolth et al, 2011)。 
12 DRA 

人 们 在 分 析 灵 长 类 准确 分 歧 时 间 时 ， 由 于 采用 
的 手段 (化 石 或 DNA 数据 )、 分 析 的 数据 来 源 ( 线 粒 
体 DNA 或 核 DNA)、 利 用 的 统计 方法 以 及 校正 方法 
等 的 不 同 ， 都 可 能 会 给 结果 带 来 个 确定 性 ， 因而 ， 
使 得 估计 灵 长 类 之 间 的 分 歧 时 间 比 确定 系统 进化 
关系 更 易 产 生 分 歧 。 例 如 ,利用 化 石 估计 的 狐 猴 与 
其 他 灵 长 类 之 间 的 分 歧 时 间 大 约 是 6000 万 年 
(Goodman et al, 1998)# 8000 万 年 (Springer et al, 
2003) 之 间 ， 跨 度 时 间 较 大 。Glazko & Nei (2003) 利 
] 2 种 不 同 的 化 石 作为 校正 标准 以 及 多 种 统计 方法 





































































































































































































检测 ,估计 出 人 类 和 其 他 灵 长 类 的 分 收 时 间 : 人 类 
和 黑猩猩 的 分 下 时 间 大 约 是 500~700 JIE, KYE 

















猩 的 是 600~800 万 年 , 红 毛 猩猩 是 1200 一 1500 万 
E, 旧 大 陆 猴 是 2100~2500 万 年 ， 新 大 陆 猴 的 是 
3200 一 3600 万 年 .这 些 数据 与 过 去 的 一 些 研究 结果 
本 一 臻 (Chen & Li, 2001; Goodman, 1999). 
在 利用 DNA 数据 估计 关系 较 近 的 物种 (如 人 类 
和 黑猩猩 的 分 歧 时 间 时 ,党 容易 忽略 一 个 问题 
BU DNA 序列 的 分 歧 时 间 不 仅 包 括 物种 分 开 之 后 的 
时 间 , 还 包括 2 条 序列 从 同一 祖先 群体 中 分 化 出 来 
经 历 的 时 间 ( 图 3)。 如 果 物 种 分 此 事件 发 生 在 较 近 时 
间 , 祖先 群体 较 大 , 那么 DNA 序 列 的 分 歧 时 间 就 大 
于 物种 的 分 歧 时 间 (Enard & Pääbo, 2004) 。 
灭绝 的 灵 长 类 物种 的 分 子 信息 也 可 用 于 分 析 
与 人 类 的 系统 发 育 关系 和 分 歧 时 间 。 尼 安 德 特 人 就 
是 一 个 典型 的 代表 。 尼 安 德 特 人 (Homo 
neanderthalensis) 生 活 于 距 今 50 万 年 前 至 距 今 约 3 
万 年 前 , 分 布 于 今天 的 欧洲 、 中 东 ， 以 及 亚洲 的 部 
分 地 区 ,而 且 现 代 人 的 祖先 知人 (Homo sapiens) 与 
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ŻA 


Human 
图 3 两 条 直系 同 源 DNA 序列 的 分 歧 时 间 
Fig.3 The divergence time of two orthologous DNA sequences 
1) 两 条 序列 从 同一 祖先 群体 中 分 化 出 来 经 历 的 时 间 ; 2) 物种 分 开 之 后 
的 时 间 (Enard & Pääbo, 2004). 


1) The time of the two sequences diverged from the common ancestral 
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Chimpanzee 



































population; 2) the time after the two species separate (Enard & Pääbo, 
2004). 


某 些 存在 于 尼 安 德 特 人 的 mtDNA 片段 并 不 存在 于 
现代 人 的 mtDNA 中 , 尼 安 德 特 人 对 早期 现代 人 的 
基因 没有 显著 贡献 。 但 Green et al (2010) 将 尼 安 德 
特 人 基因 组 测序 结果 与 现代 人 基因 组 进行 比较 后 
发 现 , 现代 人 与 尼 安 德 特 人 非常 可 能 在 小 范围 内 发 
生 过 基因 交流 , 时 间 可 能 是 现代 人 走出 非洲 之 后 。 


2 灵 长 类 基因 组 的 进化 及 机 制 


随 着 越 来 越 多 的 灵 长 类 DNA 序列 不 断 地 积累 
增多 , 特别 是 黑猩猩 、 红 毛 猩猩 和 恒 河 猴 基 因 组 的 
测序 工作 基本 完成 , 使 灵 长 类 比较 基因 组 的 研究 有 
了 丰富 的 数据 资源 。 以 下 将 从 染色 体 进 化 、 片 段 重 
复 、 插 入 缺失 和 单 核 音 酸 多 态 等 基因 组 的 结构 变化 ， 
蛋白 质 适 应 性 进化 和 基因 表达 调控 等 方面 对 灵 长 
类 基因 组 进行 比较 ， 了 解 人 类 和 非 人 灵 长 类 之 间 从 
结构 到 功能 的 差异 , 在 演化 进程 中 (如 从 猿 到 人 ) 所 
产生 的 变化 及 其 遵循 的 规律 。 
2.1 染色 体 进化 

灵 长 类 进化 过 程 中 ,染色体 的 变化 相对 保守 ， 

























































































































































































尼 安 德 特 人 在 历史 上 曾经 都 广泛 分 布 在 欧洲 且 共 
存 过 , 因此， 这 两 大 人 类 集团 很 可 能 曾经 相遇 ， 并 
有 机 会 杂交 和 繁殖， 这样， 尼 安 德 特 人 与 现代 人 的 关 
系 最 近 。Krings et al (1997，2000) 对 尼 安 德 特 人 和 
早期 现代 人 的 线粒体 DNA 进行 了 测序 , 估计 现代 
























































其 中 人 类 和 红 毛 猩猩 保持 着 与 祖先 更 为 相近 的 核 
型 。 相 对 而 言 ， 黑猩猩 和 大 猩猩 产生 了 一 些 物种 特 
异 的 染色 体重 排 (Miiller & Wienberg, 2001)。 人 类 和 
黑猩猩 因 常 染色 体重 排 导致 10 处 不 同 核 型 : 祖先 2 
条 染 末 色 体 的 端 粒 融 合 形成 人 的 2 号 染色 体 和 9 Ah 





















































人 和 尼 安 德 特 人 的 分 歧 时 间 为 50 万 年 左右 , 这 与 











间 倒 位 (Yunis & Prakash, 1982)， 这 些 差 异 都 没有 导 





























1 考古 学 和 古生物 学 估计 的 时 间 35 万 年 接近 。 其 
中 有 4 个 尼 安 德 特 人 的 mtDNA 序列 被 确定 ,表明 















































致 功 能 上 的 明显 变化 (Enard & Pääbo, 2004). 研究 发 
现 2 个 姊妹 黑猩猩 物种 一 一 普通 黑猩猩 和 倭 黑猩猩 
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的 近 着 丝 点 的 倒 位 情况 相同 (Locke et al, 2003; 
Szamalek et al, 2006)。 因此， 可 以 推断 这 些 倒 位 发 生 
在 2 种 黑猩猩 分 开 之 前 , 也 就 是 86~200 万 年 前 
(Yoder & Yang, 2000; Won & Hey, 2005), 而 且 重 排 
染色 体 区 域 蛋白 质 进化 的 速度 显著 快 于 共 线 性 染 
色 体 (colinear chromosomes) 上 的 蛋白 质 (Vallender & 
Lahn，2004a)。“ 重 组 抑制 模型 ”认为 在 早期 人 类 和 
黑猩猩 还 有 可 能 杂交 繁殖 的 时 候 ， 染色 体 区 域 重 排 
可 能 会 阻碍 人 类 和 黑猩猩 之 间 基 因 交 流 (Navarro & 
Barton, 2003a)。 研 究 发现 人 类 和 黑猩猩 在 染色 体重 
排 区 受到 较 强 的 正 选 择 作 用 (Navarro & Barton, 
2003b)， 但 是 染色 体重 排 对 于 灵 长 类 的 物种 形成 是 
否 有 重要 作用 ,还 有 待 进一步 的 研究 。 
22 ”片段 重复 

根据 所 测 基因 组 数据 发 现 , 在 灵 长 类 基因 组 中 
存在 大 量 的 长 片段 的 结构 变化 ,主要 是 由 于 片段 重 
复 等 原因 造成 的 。 在 人 类 基因 组 中 存在 很 多 重复 片 
段 (Li et al, 2001)， 比 较 现 有 的 全 基因 组 数据 ， 人 类 
基因 组 中 片段 重复 数 最 高 ， 其 覆盖 率 ( 约 5.3%) 高 于 
大 鼠 的 基因 组 ( 约 为 3%) 和 小 鼠 的 基因 组 ( 约 为 

























































































































































































































































































4.9%)(Bailey et al, 2004; Cheung et al, 2003; She et al, 


2008)。 这 些 重复 序列 位 于 相对 较 大 的 区 域内 (1 ~ 
200 kb) 的 所 谓 的 片段 复制 区 ， 至 少 每 个 单 倍 体 基 因 
组 有 两 个 拷贝 且 拷 贝 之 间 相 似 度 高 达 90% 一 
100% (Samonte & Eichler, 2002). 

比较 人 类 和 大 猿 基因 组 , 发 现 人 类 和 非洲 大 猜 
基因 组 中 存在 许多 散在 的 重复 序列 , 说 明 这 些 重复 
序列 已 经 发 生 在 其 共同 祖先 的 基因 组 中 
(Marques-Bonet et al, 2009a), 并 且 发 生 在 染色 体内 
的 片段 重复 数 大 于 发 生 在 染色 体 间 的 重复 数 (Zhang 
et al，2005)， 染 色 体 内 的 大 量 片段 重复 发 生 在 较 近 
的 1000 万 年 前 类 人 狼 祖 先 的 基因 组 中 。 相反 ,染色 
体 间 的 片段 重复 发 生 的 时 间 更 早 , KAE 2500 万 
年 前 ， 即 旧 大 陆 钦 和 类 人 狼 分 开 的 时 候 (She et al, 
2006)。 在 人 类 与 黑猩猩 分 歧 之 后 ， 大 约 每 百 万 年 有 
4~5 Mb 的 片段 重复 发 生 ,，33% 的 重复 片段 是 人 类 
特有 的 (Cheng et al, 2005)。 重 复 片段 往往 群集 于 每 
条 染色 体 的 中 部 (着 丝 粒 ) 或 亚 末端 ( 端 粒 ) 附 近 
(Bailey et al, 2002; Zhang et al, 2005)。 与 整个 基因 组 
相 比 , 重复 片段 明显 趋向 于 聚集 在 这 些 区 域 (She et 

































































































































































类 的 不 同 染 色 体 之 间 分 布 差异 很 大 ,其 比例 在 
1% 一 14% 之 间 变 化 。Y 染色 体 就 是 一 个 最 极端 的 例 
T, 其 重复 片段 ， 占 总 长 度 的 25% 以 上 。 

人 类 基因 组 的 复杂 性 可 能 是 由 于 进化 过 程 中 
片段 重复 的 结果 (Stankiewicz et al, 2004)。 由 于 重复 
片段 的 相似 性 都 较 高 ， 片 段 长 度 较 长 ,并且 重 复 片 
段 是 来 自 于 同一 个 物种 的 祖先 序列 ， 而 不 是 来 自 不 
同 物种 ,所 以 在 基因 组 中 较 难 对 它们 进行 正确 定位 
(Bailey et al, 2001). MH, 如 果 把 这 些 重 复 片段 从 
因 组 中 忽略 ,那么 人 类 和 黑猩猩 之 间 的 差异 就 会 
氏 (Liu et al, 2003). HES H BetETE TH 2 Prk Al ok 
FARBER ER, 因此 ， 片 段 重复 可 能 
在 物种 形成 过 程 中 对 产生 新 的 表 型 起 到 重要 作用 。 
在 对 3 种 灵 长 类 (猕猴 、 红 毛 猩 猩 、 黑 猩猩 ) 和 人 类 
基因 组 比较 中 发 现 片 段 重 复 引 起 的 突变 明显 区 别 
于 其 他 遗传 学 上 的 突变 (Marques-Bonet et al, 2009a), 
并 且 这 些 重复 在 人 类 进化 过 程 中 起 到 重要 的 作用 。 
人 类 基因 组 的 高 重复 片段 比率 及 与 黑猩猩 的 较 大 
差异 ,表明 人 类 的 遗传 物质 经 历 了 快速 的 功能 变革 
和 结构 改变 ,最终 导致 人 类 具有 一 些 独特 的 特征 。 
2.3 插入 和 缺失 

多 年 来 ， 在 比较 研究 人 类 和 黑猩猩 等 非 人 灵 长 
类 基因 组 的 过 程 中 ， 人 们 发 现 这 些 基因 组 之 间 的 差 
异 不 仅仅 局 限于 染色 体重 排 的 变化 上 , 还 包括 了 许 
多 微细 结构 上 的 变化 (Britten 2002; Britten et al, 
2003; Frazer et al, 2003; Kuroki et al, 2006; Liu et al, 
2003)。 这 些 变化 包括 了 基因 组 内 的 插入 和 缺失 , FF 
在 约 3%， 即 9 000 万 个 碱 基 插 入 或 缺失 的 差异 , 它 
们 在 人 类 和 黑猩猩 分 开 以 后 很 大 程度 上 改变 了 两 
者 基因 组 的 大 小 。 不 同 的 机 制 都 可 能 导致 插入 或 缺 
失 的 出 现 ， 如 DNA 复制 、 重 组 等 。 在 人 和 黑猩猩 
DNA 序列 中 , 由 于 DNA 复制 引起 的 插 缺 在 每 1000 
个 碱 基 内 就 能 找到 一 个 (Ebersberger et al, 2002). 
插 缺 在 很 大 程度 上 影响 人 类 和 黑猩猩 基因 组 
大 小 的 变化 ,基于 人 类 21 号 染色 体 测序 结果 , Frazer 
et al (2003) 用 寡 核 童 酸 芯片 技术 对 人 和 黑猩猩 等 灵 
长 类 的 21 号 染色 体 进 行 比较 , 结果 发 现 人 类 和 黑 
猩猩 的 基因 共有 57 处 不 同 排列 。 从 这 个 结果 可 以 
推断 出 ,在 整个 基因 组 的 近 30 亿 个 基因 当中 ,两 者 
存在 大 约 57000 处 不 同 排列 ， 并 且 在 黑猩猩 、 红 毛 
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al，2004)， 并 且 由 于 人 的 亚 端 粒 区 基因 密度 相对 较 
高 (Flint et al, 1997)， 因 此 ， 该 区 域 广泛 存在 多 态 性 
(Daniels et al, 2001; Trask et al, 1998). 重复 片段 在 人 














猩猩 、 恒 河 猴 和 新 大 陆 猴 有 约 9% 的 缺失 。 比 较 人 
的 21 号 染色 体 和 黑猩猩 对 应 的 22 号 染色 体 , 330 万 
对 碱 基 对 中 就 有 约 68 000 个 插 缺 (Watanabe et al, 
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2004)。 这 些 插 缺 导致 人 第 21 号 染色 体 要 比 黑 猩猩 
第 22 号 染色 体 长 400 kb, 其 中 5% 插 缺 可 能 引起 蛋 
白 序列 改变 或 产生 提前 终止 编码 (Wetterbom et al, 
2006)。 这 些 研究 说 明了 插 缺 在 灵 长 类 进化 过 程 中 的 
































猩猩 对 应 染色 体 22 号 , 结果 显示 两 者 之 间 的 差异 
(1.44%) 大 于 基因 组 平均 差异 度 (1.23%)(Watanabe et 
al，2004)。 其 他 染色 体 中 , Y 染色 体 的 核 芽 酸 变化 
(1.78%) 最 大 ,明显 高 于 基因 组 整体 差异 性 ， 而 X Ye 



































N 
































要 作用 ,为 解释 人 类 和 黑猩猩 表 型 差异 提供 了 信 
2.4 BRERA 

人 类 和 黑猩猩 基因 组 进行 排序 比较 , 结果 显示 
黑猩猩 和 人 类 基因 组 差异 性 仅 相 差 1.23%， 比 过 去 
人 们 估计 的 还 要 低 (Chimpanzee Sequencing and 
Analysis Consortium, 2005)。 整 体 上 来 看 人 类 和 黑 
猩猩 是 2 个 极其 相近 的 物种 ,两 者 之 间 的 差异 只 相 
THER 2 个 不 同人 之 间 基 因 组 差异 的 10 倍 。 它 
们 核 昔 酸 的 变化 程度 受 物 种 内 多 态 性 的 很 强 影 响 ， 





































































































色 体 的 变化 则 最 小 (0.94%)(Hughes et al, 2005; 
Kuroki et al, 2006)。 这 可 能 是 由 于 雄性 生殖 细胞 突 
变 率 较 快 造成 的 (Li et al, 2002; Makova & Li, 2002; 
Taylor et al, 2006)。 男 外 ， 人 类 和 黑猩猩 的 常 染 色 体 
的 替换 率 也 明显 不 同 (Ebersberger et al, 2002; 
Watanabe et al, 2004)， 其 原因 还 不 太 明 确 。 

另外 , 在 考虑 整个 基因 组 核 音 酸 替 换 率 时 , CpG 
(CG 两 联 核 背 酸 常 称 作 CpG， 以 表明 连接 两 个 核 背 
酸 的 磷酸 二 月 键 ) 占 DNA 序列 中 的 比例 也 是 个 重要 
因素 (Enard & Pääbo, 2004)。 因为 CpG 二 联 核 痛 酸 




























































































如 果 不 考虑 物种 内 核 音 酸 多 态 性 的 话 , 那么 人 类 和 
黑猩猩 的 DNA 序列 差异 性 更 低 (~1%) ( Chimpanzee 
Sequencing and Analysis Consortium, 2005)。 

比较 黑猩猩 和 人 类 X 染色 体 上 10 kb 区域, 黑 
猩猩 种 内 DNA 序列 的 差异 是 人 类 的 3 倍 
(Kaessmann et al, 2001)。 如 果 把 人 类 、 倭 黑猩猩 和 
黑猩猩 (非洲 东部 、 西 部 和 中 部 ) 更 大 区 域 的 DNA 进 
行 比 较 , 发 现 黑猩猩 序列 的 种 内 差异 是 人 类 的 1.5 
这 之 多 (Yu et al, 2003)。 在 中 性 位 点 上 ( 即 该 位 点 发 
生 改 变 并 不 影响 生物 体 的 适合 度 )， 可 以 利用 观察 
到 的 物种 间 替 换 率 来 估计 突变 率 。 大 猿 的 每 年 突变 
率 在 进化 过 程 中 比较 稳定 ， 旧 大 陆 猴 的 突变 率 比 大 
狼 的 高 30%， 狐 猴 的 突变 率 是 大 狼 的 2 倍 (Liu et al, 
2003), 小 鼠 的 突变 率 是 大 猿 的 5 倍 (Waterston et al, 
2002)。“ 世 代 假 说 ”(generation time hypothesis) 似 乎 
能 部 分 解释 其 差异 性 ,虽然 现在 大 家 对 该 假说 还 持 
争议 。 根 据 世 代 假 说 (Li et al, 1996), 大 多 数 的 生殖 
细胞 产生 的 突变 来 自 DNA 的 错误 复制 。 世 代 时 间 
越 长 ， 每 次 参与 复制 的 生殖 细胞 数量 就 越 少 ,那么 
职 累 固 定 下 来 的 替换 突变 就 越 少 。 因 此 ， 世 代 时 间 
长 的 物种 , 分 子 进化 速率 ( 即 进化 钟 运转 速度 ) 就 比 
世代 时 间 短 的 物种 慢 。 在 所 有 有 灵 长 类 动物 中 ， 人 类 
的 “进化 钟 ” 运 转 最 慢 (Elango et al, 2006),， 也 就 是 说 
人 类 基因 组 内 单 核 音 酸 变异 更 少 , 基因 组 更 稳定 ; 
黑猩猩 “进化 钟 " 的 运转 仅 比 人 类 稍 快 一 些 , 但 明显 
比 大 猩猩 和 猩猩 慢 ， 从 而 进一步 证 明 人 类 和 黑猩猩 
的 关系 最 近 (Elango et al, 2006)。 

人 类 和 黑猩猩 的 单 核 昔 酸 蔡 换 率 在 基因 组 不 
同 的 范围 又 各 不 相同 。 比 较 人 类 21 SOLA 







































































































































































































































































=e 
















































































与 一 种 重要 的 化 学 修饰 一 一 甲 基 化 密切 相关 ， 甲 基 
化 后 的 胞 喀 啶 特别 容易 发 生 突 变 (特别 是 突变 成 
TpG 和 CpA) 。 因 此 ， 在 估计 突变 率 时 , 需要 考虑 
CpG 位 点 的 变化 (Hellmann et al, 2003)。 
2.5 ”蛋白 质 编码 基 因 的 适应 性 进化 

人 类 与 黑猩猩 的 蛋白质, 平均 只 差 2 个 氨基 酸 ， 
约 有 1/3 的 蛋白 质 完全 相同 (Chimpanzee Sequencing 
and Analysis Consortium, 2005)。 对 于 编码 蛋白 的 基 
K, JEF XE (nonsynonymous substitution rate, 
Ko) 与 同 义 替 换 率 (synonymous substitution rate, Ks) 
的 比率 (Ka/Ks) 被 广泛 地 用 来 检测 基因 在 进化 过 程 
中 受到 怎样 的 选择 作用 (Miyata & Yasunaga, 1980; 
Li, 1993). ZIE, 同 义 蔡 换 被 假定 为 是 不 改变 生 
物 的 适合 度 的 , 属于 中 性 蔡 换 。 如 果 Ka/Ks <1, 说 
明 该 基因 在 进化 过 程 中 受到 纯化 选择 (purifying 
selection) 的 作用 ， 即 蛋白 质 功能 受到 限制 ; 4 
Ka/Ks = 1， 则 该 基因 被 认为 经 历 了 一 个 中 性 的 进化 
历程 ; 而 如 果 Ka/Ks > 1， 即 某 些 氨基 酸 替 换 具 有 选 
择 上 的 优势 ,其 固定 的 概率 和 速度 要 大 于 同 义 替 换 ， 
说 明 该 基因 在 进化 过 程 中 受到 了 正 选 择 (positive 
selection) 作 用 。 人 和 黑猩猩 之 间 约 70% 的 氨基 酸 蔡 
代 都 是 轻微 有 害 的 (Hellmann et al, 2003). 然而 ,也 
存在 一 部 分 替代 是 有 利 的 。 但 是 , 仅 用 Ka/Ks 的 值 
来 决定 整个 编码 区 是 否 受到 正 选 择 , 往往 灵敏 度 不 
i (Ellegren, 2005; Kitano et al, 2004; Nielsen et al, 
2005), WA HE Ka/Ks<1 的 基因 实际 上 在 进化 中 受到 
强烈 的 正 选择 (Dorus et al, 2006): 蛋白 质 重要 功能 
域 的 某 个 氮 基 酸 改 变 ， 也 许 不 会 很 快 表现 出 来 
(Andrés et al, 2004)， 但 蛋白 质 其 他 区 域 受 到 负 选 择 




















































































































































































































































































































































































































作用 ,那么 整个 基因 的 Ka/Ks 仍 小 于 1。 考 虑 以 上 
可 能 出 现 的 情况 ,现在 已 发 展 出 一 些 新 的 方法 研究 
某 些 分 支 或 一 些 位 点 (branch-site) 的 正 选 择 作用 
(Zhang et al, 2005). CSAC 对 人 类 和 黑猩猩 13454 
个 同 源 基因 对 进行 检验 ，585 个 基因 在 人 类 进化 过 
程 中 可 能 受到 正 选 择 , Ka/Ks>1。 但 结果 明显 比 其 他 
2 个 类 似 的 检验 (Clark et al, 2003; Nielsen et al, 2005) 
得 到 的 基因 数 少 。Arbiza et al (2006) 应 用 两 分 支 一 
位 点 最 大 似 然 法 (two branch-site maximum likehood) 
对 人 类 、 黑 猩猩 、 大 鼠 、 小 鼠 和 狗 的 13 198 个 同 源 
基因 进行 检验 , 结果 显示 人 类 和 黑猩猩 分 别 有 5% 
和 10% 的 基因 受到 正 选 择 作用 ,类 似 的 结论 也 得 到 
了 更 多 的 证 据 证 明 (Bakewell et al, 2007)。 人 类 受 正 
选择 的 基因 之 所 以 比 黑猩猩 的 少 , 可 能 是 进化 过 程 
中 人 类 有 效 群体 较 小 的 缘故 (Chen & Li, 2001)。 
研究 发 现 受到 正 选 择 的 基因 有 一 定 的 功能 偏 
好 性 ， 人 类 基因 组 中 受到 正 选择 的 基因 主要 是 与 免 
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关 的 基因 FOXP2 的 序列 比较 研究 (Enard et al, 
2002b; Lai et al, 2001). 

Dorus et al (2004) 通 过 比较 灵 长 类 (人 类 和 猕猴 ) 
和 吵 齿 类 (大 鼠 和 小 鼠 ) 的 214 个 神经 系统 相关 基因 
的 错 义 突变 和 同 义 突变 比率 (KaAs) 发 现 ,神经 系统 
相关 基因 特别 是 脑 发 育 相 关 基 因 在 人 类 起 源 过 程 
中 有 加 速 进化 的 趋势 ,表明 这 一 类 基因 可 能 受到 正 
选择 。 进 一 步 比 较 人 和 猕猴 (以 松鼠 猴 作 外 群 )、 人 
和 黑猩猩 (以 猕猴 作 外 群 ) 的 序列 后 发 现 , 神经 系统 
相关 基因 在 人 这 一 支 系 Ka/Ks 较 大 ; 但 是 研究 发 现 ， 
当 人 类 和 黑猩猩 进行 比较 , 脑 中 表达 量 极 高 的 那些 
基因 在 人 类 这 一 支 很 少 或 不 受到 正 选择 作用 
(Nielsen et al, 2005); 脑 部 表达 的 2633 个 基因 ， 也 
WA 47 个 基因 在 人 类 进化 中 受到 正 选 择 ， 而 黑 狸 
猩 没有 (Yu et al, 2006)。 这 些 结果 显示 , 在 进化 过 
程 中 那些 在 脑 的 某 些 部 位 特异 表达 或 是 表达 量 较 
低 的 基因 , 或 是 那些 表达 量 发 生 改 变 的 基因 ， 可 能 


























































































































































































































疫 、 生 殖 、 神 经 功能 以 及 一 些 与 特殊 环境 相关 的 基 
因 (Miller et al, 2004; Vallender & Lahn, 2004b)。 这 些 
基因 中 ,特别 是 免疫 和 生殖 相关 的 基因 不 仅 在 人 
类 ， 而 且 在 黑猩猩 都 受到 选择 作用 (Arbiza et al, 
2006)， 而 与 脑 功能 /神经 发 育 相 关 基 因 的 适应 性 进 
化 从 一 开始 就 与 人 类 出 现 特 有 的 特征 相 联系 。 有 些 
基因 在 灵 长 类 进化 过 程 中 受到 正 选 择 作用 ,并 且 在 




















































































































与 人 类 脑 发 育 和 认 知 能 力 密切 相关 。 

2.6 ”基因 表达 调控 

由 于 基因 组 DNA 序列 上 , 特别 是 蛋白 质 水 平 
上 的 高 度 相 似 难以 解释 人 类 和 黑猩猩 之 间 认 知 能 
力 上 的 巨大 差异 , 因此 ， 人 们 试图 从 基因 表达 水 平 
上 来 探讨 这 个 问题 (Carroll, 2005; King & Wilson, 
1975)。 有 一 种 观点 认为 人 和 其 他 动物 认 知 能 力 上 的 











































































































现代 人 群 中 也 仍然 还 存在 选择 信号 , 如 影响 脑 容 
大 小 的 两 个 基因 MCPHI (microcephalin) 和 ASPM 
(abnormal spindle-like microcephaly-associated)， 这 2 
个 基因 的 编码 区 发 生菜 些 突变 ,都 会 导致 原 发 性 
脑 症 (primary microcephaly, MCPH) 一 一 脑 容量 是 正 
常人 的 1/3, 但 脑 部 沟 回 等 结构 却 基 本 正常 (Bond et 
al, 2002; Jackson et al, 2002; Roberts et al, 2002)。 

ASPM 在 灵 长 类 的 进化 和 人 类 起 源 过 程 中 受到 显著 
的 正 选 择 作 用 ， MCPHI 的 进化 模式 也 是 类 似 的 
(Evans et al, 2004a, b; Evans et al, 2005; Kouprina et 
al, 2004; Wang & Su, 2004; Zhang, 2003), 这 2 个 基 
因 可 能 在 人 类 起 源 过 程 中 对 脑 容量 的 增 大 发 挥 一 
定 的 作用 。 最 近 研 究 发 现 这 两 个 基因 在 现代 人 和 群 中 
仍然 受到 正 选 择 作用 , 说 明 现代 人 的 脑 还 处 于 继续 
进化 的 过 程 中 (Evans et al, 2005; Mekel-Bobrov et 
al，2005)。 在 人 类 起 源 过 程 中 受到 达尔 文正 选择 的 
基因 ,还 可 能 是 由 于 编码 区 的 少数 几 个 氨基 酸 的 改 
变 ， 导致 了 和 蛋白质 功 能 的 改变 , 进而 引起 表 型 的 巨 
大 变异 。 一 个 典型 的 例子 就 是 对 与 人 类 语言 功能 相 
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巨大 差异 是 由 于 基因 表达 水 平 的 差异 引起 的 
(Enard et al, 2002a; King & Wilson, 1975; Marvanova 
et al, 2003; Normile, 2001). 

近年 来 ,研究 者 采用 基因 芯片 技术 (microarray) 
研究 基因 的 表达 差异 。 利 用 该 技术 比较 人 类 和 非 人 
灵 长 类 的 基因 表达 谱 ， 揭 示 在 人 类 和 非 人 灵 长 类 之 
间 差 异 表 达 的 基因 和 基因 家 族 ， 以 及 相关 代谢 途径 
中 的 基因 群 , 已 经 成 为 了 近年 来 研究 的 一 个 热点 
(Caceres et al, 2003; Enard et al, 2002a; Gilad et al, 
2006; Karaman et al, 2003; Khaitovich et al, 2005; 
Marvanova et al, 2003)。 这 些 研究 结果 发 现 ， 人 类 和 
黑猩猩 的 基因 表达 谱 存 在 物种 特异 性 和 组 织 特异 
性 的 特点 ,而 且 这 些 差 异 并 不 是 因为 环境 因素 的 差 
寞 随机 产生 的 , 而 是 有 一 定 的 遗传 学 基础 的 。 利 用 
芯片 技术 还 检测 到 在 衰老 过 程 中 人 类 和 黑猩猩 脑 
组 织 许多 基因 表达 发 生变 化 , 但 是 两 者 变化 的 模式 
明显 不 同 。 这 提示 在 不 同 物种 的 整个 基因 组 中 , 可 
能 存在 着 一 些 包 括 与 衰老 相关 的 基因 表达 量 快速 
进化 的 改变 (Fraser et al, 2005)。 比 较 人 类 和 黑猩猩 
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各 组 织 基因 表达 情况 ,发现 两 者 存在 表达 差异 基因 


动 物 学 

















数 最 多 的 组 织 是 睾丸 (Khaitovich et al, 2005). 相反 ， 





研 究 





如 脑 组 织 中 的 变化 大 (Enard et al, 2004). 

















有 证 据 i 





























存在 差异 基因 数 最 少 的 是 脑 组 织 , 这 可 能 与 在 高 级 


灵 长 类 中 脑 
X (Enard et al, 2002a; Khaitovich et al, 2005); 但 是 ， 
如 果 在 人 类 和 黑猩猩 脑 组 织 中 表达 存在 差异 的 基 
因 , 往往 在 人 类 脑 组 织 中 的 表达 量 要 高 些 (Ciéceres 
































功能 相关 基因 的 表达 受到 功能 限制 有 












































et al, 2003; Enard et al, 2002a), 并 且 这 些 在 人 脑 中 
上 调 的 基因 往往 是 人 脑 组 织 特异 表达 的 基因 (Gilad 
et al, 2006)。 然 而 ， 黑 猩猩 脑 中 有 些 与 智力 相关 如 

































































快速 识别 眼 - 手 信号 等 


J 基因 表达 增强 (Inoue & 

















Matsuzawa, 2007). 通过 比较 还 发 现 了 一 些 规 律 ， 比 


如 性 染色 体 、 























i 复 片 段 和 染色 体重 排 的 区 域 在 两 个 


物种 之 间 表 达 差 异 较 大 (Marques-Bonet et al, 2004). 
造成 基因 表达 存在 差异 的 原因 可 能 是 基因 的 




















调控 区 方 


加 工 和 翻译 、 


以 及 mic 


列 差异 、 调 控 起 始 受 到 不 同 的 控制 、RNA 
染色 体 结 构 的 不 同 修 饰 、 选 择 性 剪 切 
IORNA 的 调控 等 。 基 因 局 动 子 序列 的 变化 




















在 某 种 程度 上 影响 人 类 个 体 的 基因 转录 水 平 (Bray 
et al, 2003; Hoogendoorn et al, 2003; Trinklein et al, 








2003), FY fe AN 


式 (trans- 








序列 变化 导致 顺 式 (cis-) 和 反 
) 调 探 因子 的 结合 能 力 改变 (Pilpel et al, 











2001)。 个 体 间 基因 表达 差异 受到 多 个 cis- 和 trans- 
调控 因子 的 影响 ,物种 间 基 因 表 达 差 异 也 可 能 受到 





多 种 遗传 因素 的 作用 。 人 们 在 下 
























































究 高 等 灵 长 类 基因 








表达 差异 时 , 发 现在 人 类 这 一 文系 中 转录 因子 比 人 


类 其 它 蛋 白 的 进化 速度 要 ! 


Š, A 


改变 ,能 通过 改变 转录 因子 
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类。 转录 因子 的 加 速 进化 
什么 发 生 在 关键 位 置 上 的 如 此 少 的 遗传 学 
结合 能 力 而 多 效 地 影响 









































许多 不 同 基因 的 表达 模式 。 因 此 ,我 们 可 以 推测 引 


AKF 



































1 黑猩猩 之 间 基 因 表达 差异 的 最 主要 因素 














是 人 类 转录 因子 的 快速 进化 。 为 了 更 充分 地 了 解 灵 
长 类 基因 转录 体 的 进化 , 还 需要 对 更 多 的 个 体 和 组 











织 进行 研究 。 现 在 使 用 的 芯片 杂交 技术 往往 因为 灵 























长 类 之 
算 处 理 ， 
话 , 将 大 





J 序列 差异 受到 影响 ,进而 影响 了 结果 的 运 
如 果 能 对 各 个 灵 长 类 设计 其 


大 改变 现状 。 














特异 的 芯片 的 








探究 基因 表达 差异 的 原因 ， 人 们 在 比较 人 类 和 




















黑猩猩 DNA 甲 基 化 情况 时 ,还 发 现 人 类 脑 组 织 





甲 基 化 程 


E 度 远大 于 黑猩猩 脑 组 织 ,其 他 人 体 组 织 ， 





























如 肝脏 和 淋巴 细胞 也 出 现 高 水 平 的 甲 基 化 , 但 并 不 




















FE 明 甲 基 化 可 能 引起 以 往 人 们 下 








最 近 , 许多 
到 microRNA 的 











有 重要 调控 作 


H3 UTR 的 结合 




















33 卷 





目前 还 没 
究 中 观察 





NI 














到 的 基因 表达 差异 (Enard & Pääbo, 2004). 
研究 发 现 物种 间 基 
调控 。microRNA 可 以 通过 与 mRNA 








因 表达 差异 还 受 




















降解 该 分 子 ， 

















37UTR 的 进化 有 明显 
人 类 和 其 他 灵 长 类 大 脑 miRNAs 对 比 ' 























是 一 种 对 基因 表达 具 
i] 的 非 编 码 RNA， 对 功 
J 影响 (Stark et al, 2005)。 在 














能 基因 

















， 还 发 现 许 


多 灵 长 类 进化 产生 的 新 miRNAs 不 是 保守 的 ,这 说 
明 这 些 miRNA 起 源 比 较 晚 ,受到 强烈 的 正 选 择 , 存 
(Zhang et al，2007)， 而 且 一 些 


在 快速 的 进化 








miRNAs 是 物 利 



































PRETERI, AEH 






































选择 的 基因 以 及 表达 差异 的 基 
人 类 特异 的 重复 和 假 基 基 

















通过 复制 在 物种 中 
出 现 了 扩 增 , 这 些 数 据说 明 miRNAs 的 进化 还 在 进 
ÍT, 并 且 除 了 一 些 古 老 的 高 保守 性 的 miRNAs, 也 
出 现 了 一 些 新 miRNAs。 

通过 对 人 类 和 非 人 灵 长 类 基 
发 现 人 类 特异 的 突变 、 人 类 特有 





因 组 的 比较 , 除了 
(无 ) 的 基因 、 受 正 

















因 外 , 还 观察 到 一 些 
化 事件 (Fortna et al, 2004; 








Wang et al, 2006), 这 些 差 异 都 有 可 能 在 人 类 起 源 过 














程 中 发 挥 作用 


























通过 对 其 




















类 起 源 过 程 的 遗传 本 质 。 


3 小 结 和 展望 
目前 , 除了 黑猩猩 、 猕 猴 和 红 毛 猩猩 全 基因 组 


测序 基本 完成 和 
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的 前 景 。 
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中 。 随 着 这 些 基 





， 其 他 灵 长 类 基 






































究 有 助 于 进 


步 揭示 人 


























因 组 测序 还 在 进行 
因 组 测序 工作 的 完成 ,将 给 灵 长 类 
较 基 因 组 学 带 来 更 丰富 的 数据 资源 ,对 人 们 了 解 
长 类 的 进化 ,以 及 更 好 地 认识 人 类 本 身 带 来 广阔 
在 此 基础 上 ,建立 合适 的 灵 长 类 动物 模型 ， 

















因 表达 、DNA 序列 变化 


研究 基因 组 中 插 缺 、 基 因 失 活 和 基因 转 座 等 现象 ; 
通过 有 效 整合 各 个 基因 组 基 
功能 变化 的 数据 ， 有 助 于 充分 认识 有 关 灵 长 类 特 


























是 人 类 表 型 改变 的 遗传 学 机 制 等 一 系列 问题 。 
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Si = 


有 重大 的 影响 。 


长 类 物种 基因 
的 重大 机 遇 , 不 仅 对 基 
行为 科学 、 分 子 生物 学 、 遗 传 学 、 














组 测序 的 完成 将 是 比较 基因 组 学 
因 组 学 ， 而 且 对 神经 科学 、 











发 育 生 物 学 等 都 


在 此 基础 上 ， 人 类 与 非 人 灵 长 类 基 











因 组 比较 工作 将 全 面 




















E 进 , 解释 人 类 进化 的 许多 疑 


H, 为 揭示 人 类 起 源 之 谜 翻 开 新 的 篇 章 。 
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